ChatGPT4都要来了，你是否了解人工智能绘画的原理及未来？

TRex-1667 MANA新媒体艺术站 2023-07-10

前言

距离GPT-3.5推出才刚刚105天，美国的OpenAI公司正式官宣了新的模型GPT-4 ，堪比从学渣到学霸的惊人提升，在全球范围内掀起一股关于AI讨论的热潮，随着GPT-4的到来，人工智能技术也不断得到创新和改进，比如人工智能在绘画中的应用，人工智能绘画是利用机器学习、计算机视觉和图像处理技术，让计算机系统可以像人类一样绘画，甚至可以创造出完全独特的艺术作品。在过去的几年中，人工智能绘画已经取得了很多进展，其中一些作品已经在艺术市场中获得了较高的评价。而随着Chat GPT4的到来，我们可以期待更加先进和出色的人工智能绘画技术将会带来怎样的未来？你是否真的了解人工智能绘画的原理呢？

MANA平台艺术家陈天禅人工智能算法作品《顶点》
本文作者陈天禅以自己在人工智能艺术创作上的探索，与大家分享了他的富有创新与建议性的思考与实践，希望能为大家带来一些关于人工智能创作方面的启发。

在过去十年左右的时间里，人工智能技术以几何极的速度迅速发展。得益于电子计算机的硬件发展以及互联网大数据环境，人工智能从科技领域开始出现在各行各业生产活动中。近两年来，人工智能技术更是以惊人的发展速度开始涉足音乐、视觉艺术及设计艺术领域，并且已经取得了令人瞩目的成果。

就在去年美国科罗拉多州举办的一场博览会美术比赛上，一幅名为《Théâtre D'opéra Spatial》绘画获得了一等奖，这原本是件再平常不过的事，然而赛后作者发布的一篇声明却震惊了整个西方艺术界，这幅作品是通过当下最流行的人工智能绘画软件“Mid journey”绘制生成的，这款软件存在的时间其实并不短，而且一直以快速精美的人工智能绘画，而获得诸多用户青睐，但是由其生成的绘画图像在艺术比赛中获得大奖，这在艺术界是第一次发生的事件，因此西方美术界开始非常关注其人工智能绘画的未来前景，人们开始对人工智能绘画的艺术性、伦理性、技术性进行广泛深入讨论，甚至有一部分艺术家在人工智能深度学习与强大的计算性能面前，发出了艺术已死的极端呼声。

图1 《Théâtre D’opéra Spatial》人工智能绘画

我们也许大可不必对人工智能绘画过早的进行定义，因为该领域仍然存在许多未知部分等待艺术家去探索。近期，有位艺术家就以一种出乎寻常的方式对人工智能的自我意识进行多次实验，并由人工智能自动生成出了下面这幅名为《我是谁？》的图像作品。该作品从绘画风格以及视觉表达上都与传统人工智能绘画极其相似，但是它们背后生成的底层逻辑与深层原理却大相径庭。

图2 《我是谁？》人工智能绘画 8192×8192分辨率陈天禅 2022年

传统人工智能绘画是以输入关键词为工作前提的，比如，若想要生成这幅名为《我是谁？》的图画，一般的关键词会设置为：女性、白色衣服、黄色皮肤、莲花、具象表现主义风格等。然而这幅作品在创作生成过程中，作者并没有输入这些关键词，而是不断向人工智能程序反复提出一个问题，那便是：我是谁？然后再通过一种类似于图灵测试的方式不断发问，人工智能软件在这样的追问下出现过崩溃，输出异常和异形输出等情况，人工智能程序在反复的尝试理解，学习这一问题后，最后给出了自己的答案：就是这幅《我是谁？》绘画作品。

图3 人工智能绘画软件中的prompts

这就带来一个问题，人工智能是否能够有自主意识能和艺术家一样进行艺术创作？在探讨这个问题之前，我们必须要对什么是人工智能？这个问题有一定程度的认知，才能够继续的深入探讨。

由于影视作品的影响，人们往往会对人工智能，有一种人类外壳拟人化形象的理解，但导致这一因素，主要还是因为人们总喜欢以自己的视角去理解认知其他的事物。事实上人工智能的外形是无形的，它是一种数学语言化，逻辑化的抽象存在。之所以会这样，是因为人工智能的载体计算机就是以数学的二进制语言为基础而存在的。

图4 人工智能的“外形”

对计算机而言，无论是多么华丽的画面，多么优美的旋律，多么深邃的思想文字通通不过是以0和1所组成的代码串符而已。以下图为例，在计算机键盘上的字母，数字符号，输入到计算机当中时，都不过是一个长达8位的二进制代码，这也是在计算机语言当中常常说到的一个名词：字节。

图5 计算机键盘二进制代码表

在了解了计算机基本语言之后，我们暂时将自己传统的认知放下，并尝试着以一种极其理性的逻辑方式，带入到人工智能的运行模式当中。

目前人工智能绘画的主流学习方式是基于计算机的深度学习模式进行的，学习的第一步便是对图像的识别。与人类的视觉系统、感知系统所不同的是，计算机在接收到同样的光电信号之后，它们所认知的方式并不是瞬间区分物体的，而是统一将图像切割为若干等同大小的网格，再对每一网格中图像信号进行分析，并计算其与相邻网格相似度的概率，从而识别物体。这便是为什么在我们看到人工智能识别物体时，总是以长方形为选取单位。

图6 人工智能图像识别原理

在人工智能经过对图像的识别学习后，便开始进行实际绘画的部分。与人类的绘画逻辑截然不同的是，人工智能的绘画更像是以橡皮擦除的（减法）一种绘画。在绘画的初期阶段，人工智能会先将一些随机的图像信号导入的画布当中，之后再根据之前所输入的指令，比如之前所输入的指令当中有花朵的词语，对画布中的光电信号进行擦除，无关或被认为是无用的部分。然后不断重复这一步骤，直到生成最后的图像。

图7 人工智能绘画原理

这种绘画生成方式，初期并不是非常成熟，尤其对于细节的刻画，并不能够做到人类艺术家那般的细致，这也是为什么？那幅在科罗拉多博览会获得大奖的艺术作品饱受诟病的地方。在我们对图像进行放大以后会发现其人脸部分以及空间顶部深处部分，极其缺乏细节的表现，这便是人工智能绘画技术在初期的主要弊端。同时由于这一技术的特点，使得人工智能在对于一些比较宽泛的关键词，比如“中东人”这一词不能够做出非常精细的刻画，以至于生成后的图像显得诡异且不合常理。

图8 人工智能画出的中东战士显得异常诡异

然而就在近期，另外一幅绘画使得人们对人工智能的性能不得不产生震惊，这幅绘画是要求模仿梵高的早期绘画风格，去绘制一副小丑的肖像。这幅由苏格兰艺术家Perry Jonsson所绘制的人工智能图像，在人物轮廓结构等细节方面，都较为精细，且对梵高早期艺术风格有着极相似的模仿。这不由使得我们生发出人工智能绘画在未来会代替原先只能由艺术家所做的工作，甚至直接淘汰某个领域里的职业岗位。

图9 艺术家Perry Jonsson使用人工智能绘制的小丑

我们举一个由技术革命而消失的艺术职业。以前歌剧表演舞台中，需要有许多名为“画片”的舞台背景，它们为舞台提供更丰富的视觉效果，而在过去，“画片”必须由专业的艺术家进行绘制，而且造价不菲。然而随着计算机科技的进步与硬件迭代，投影仪，液晶显示屏，曲面显示屏，AR技术，全息影像技术的出现，使得当今舞台演出现场，再也不需要以“画片”作为舞台背景，那些依靠绘制“画片”谋生的艺术家，自然便被淹没在时代的海洋当中。

图10 作为传统舞台背景的“画片”

图11 当代舞台可以使用各种各样的技术

同样，由于人工智能绘画的出现以及数字打印技术的不断成熟，使得许多当下艺术家正在从事的行业或将受到极大的冲击，比如商业性绘画，广告插图，街景画等等都极有可能逐渐被人工智能绘画所替代，这是因为人工智能绘画具有两个极为重要的特性，第一是软件开源，任何人都可以访问学习，第二是快捷。

在当下信息爆炸的时代，社会各行各业始终讲究高效二字，当在现实生活中，有开源免费的人工智能绘画软件，再以极其低廉费用进行打印便可以获得一幅可供欣赏，有艺术性的绘画时，人们又何必再去艺术家那边以高价或者以远高于人工智能绘画成本的价格再去购买一幅商业绘画呢？人工智能绘画究竟可以在多大程度上替代人类艺术性的创造劳动？以及其真正的价值所在？

图12 人工智能可以在短时间内大量生成图像

笔者认为，对机械，对科技的掌握不能仅仅浮现于表面，需要真正从其运行的原理去理解它是如何操作的，因为工具是人类肢体与思想的延伸，如果仅仅是浅尝而止，那其实艺术家和机器形成的是一种合作关系，只有真正能够懂得技术的原理，自己可以随心所欲的调节自己所需的参数，才能做到人机一体，或者说与机器形成一种共谋关系。也正因如此，笔者对人工智能绘画进行了相当长时间的学习和研究，前文展示的那幅名为《我是谁？》的绘画，正是出自笔者之手。在此，笔者将分享一些在人工智能绘画领域进行研究与探索的路径。

首先笔者对人工智能绘画的性能进行了探索，这个部分的探索主要围绕两个方面展开，第一个是分辨率，第二个则是循环次数。首先只有足够高的分辨率，才有足够的像素空间去展示足够的细节信息，因此在不断的测试机器的极限后，笔者得到了以下的这幅作品名为《Pioneer》，该幅绘画的分辨率达到了9600×12800，可以极高的分辨率打印在巨大幅面的画布上，为了能够展现足够多的画面细节，笔者将绘画的循环设置到了20000次, 从而使得画面尽可能产生足够多的具体的细节及图像信息。

图13 Pioneer 人工智能绘画 9600×12800分辨率

除此以外，笔者还采用了一种类似于人工干预的方式进行创作。每一次会话指令下达时，笔者都要求人工智能进行10张作品的绘制，之后再从其中挑选出一张最满意的图像作为下一代图像的参照，之后反复进行三次筛选，最终得到了此幅绘画。

因为人工智能绘画的特性，导致了其无法正常判断何为理性、何为美感，因此在加入了人工的选择以及判断之后，图像由最初的一行行代码逐渐发展为具有艺术性、写实性的图像。之后笔者又对人工智能的自我意识进行了尝试性探索，该话题目前在人工智能业界仍然是个充满争议的话题。很多人认为人工智能并不具备自我意识，仅仅是对事物的模仿，对信息的筛选，它凭借高速的运算能力使得其仿佛有人类智慧的行为存在，然而也有以MIT教授、研究者为主的学派认为人工智能存在自我意识，只是其思考方式与人类不同而已。

这也使得笔者对人工智能是否具有自我意识产生了浓厚兴趣并进行实验，这其中最著名的一种方式便是图灵测试，通过对人工智能进行不同的提问，以探求其自我认知，自我意识是否存在？诚然以绘图表现为主的人工智能程序，是无法以文字表达方式给予我们答案的，但是这幅名为《我是谁？》的图像，兴许是在冥冥之中反映出来：人工智能尝试性解读自身并进行自我描绘的样子。

关于本文作者

陈天禅

陈天禅是一位拥有近10年数学、编程和人工智能学术背景的艺术家。目前正在麻省理工学院数据、系统与社会学院（IDSS）攻读机器学习项目。凭借在阿尔弗雷德大学的艺术硕士学位和伍伦贡大学的数学学士学位的学习，他的艺术作品致力于展现深刻的前瞻性和理性之美，如今正迅速在全球范围内传播。2019年至2021年期间，陈天禅作为北京澜景科技有限公司的一员，参与了XR技术软件的研发以及艺术市场的扩张实施。他在文本翻译、跨文化交流、品牌管理和数据分析方面具备出色的技能，并在艺术与技术领域的学术展示上表现卓越。

过往作品《顶点》

作品“顶点”虽然融入了艺术家的想象力，但底层逻辑是基于“向量场”的数学概念。这些概念在数学和物理领域传统上是复杂和抽象的，艺术家过在人工智能中使用视频技术，让原本冷酷的宇宙法则变得生动活泼。

时间对于人类来说是一种奇怪的现象。我们常常漫不经心地浪费它，只是在宝贵的时光溜走时才为它的损失而哀叹。然而，在浩瀚的宇宙中，时间可能不仅仅是一条线，而是一个环，一个永无止境的重生和更新循环。那些我们曾经细细品味的转瞬即逝的美丽，我们逝去的挚爱灵魂，终究会与我们重逢，不是今生，而是在遥远的未来，在我们的身体经过无数次消融和重组之后。可能是从现在开始，4 亿年、4 万亿年或4万万亿年之后。但准确的时间间隔无关紧要：真正重要的是我们将再次相逢。

近期文章推荐

在武汉邂逅一场可以被“吃”掉的艺术展

中国首个齐白石沉浸式数字光影艺术大展

四川美术学院&电子科技大学40多位创作者联合打造“无界漂移”

文章投稿及作品推广

添加微信：artmana

MANA | 全球新媒体艺术平台，MANA是全球新媒体艺术行业媒体与资源对接平台，致力于建立艺术、设计与科技协同创新的生态系统。MANA持续聚焦追踪行业热点，旨在提升优秀原创、艺术科技跨界的影响力，为相关领域人士提供交流互励平台，为优秀创作者赋能，为企业及品牌整合对接优质的行业资源，推动行业发展。／官方网站／www.manamana.net

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！

ChatGPT4都要来了，你是否了解人工智能绘画的原理及未来？

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突 认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！

生成图片，分享到微信朋友圈

ChatGPT4都要来了，你是否了解人工智能绘画的原理及未来？

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡